AI资讯新闻榜单内容搜索-Llama 2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Llama 2
Sebastian Raschka最新博客:从头开始,用Llama 2构建Llama 3.2

Sebastian Raschka最新博客:从头开始,用Llama 2构建Llama 3.2

Sebastian Raschka最新博客:从头开始,用Llama 2构建Llama 3.2

十天前的 Meta Connect 2024 大会上,开源领域迎来了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。两个版本都是纯文本模型,但也具备多语言文本生成和工具调用能力。Meta 表示,这些模型可让开发者构建个性化的、在设备本地上运行的通用应用 —— 这类应用将具备很强的隐私性,因为数据无需离开设备。

来自主题: AI资讯
3471 点击    2024-10-06 15:59
Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%

Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%

Meta开发System 2蒸馏技术,Llama 2对话模型任务准确率接近100%

研究者表示,如果 Sytem 2 蒸馏可以成为未来持续学习 AI 系统的重要特征,则可以进一步提升 System 2 表现不那么好的推理任务的性能。

来自主题: AI技术研报
9458 点击    2024-07-14 13:36
LLM的「母语」是什么?

LLM的「母语」是什么?

LLM的「母语」是什么?

在以英语为主的语料库上训练的多语言LLM,是否使用英语作为内部语言?对此,来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报
8784 点击    2024-06-03 10:53
最强开源大模型Llama 3来了,4000亿参数狙击GPT-4,训练数据达Llama 2七倍

最强开源大模型Llama 3来了,4000亿参数狙击GPT-4,训练数据达Llama 2七倍

最强开源大模型Llama 3来了,4000亿参数狙击GPT-4,训练数据达Llama 2七倍

智东西4月19日消息,Meta推出迄今为止能力最强的开源大模型Llama 3系列,发布8B和70B两个版本。 Llama 3在一众榜单中取得开源SOTA(当前最优效果)。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mistral 7B Instruct。

来自主题: AI技术研报
7263 点击    2024-04-20 12:10
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B

Stability AI推出Stable LM 2 12B模型,作为其新模型系列的进一步升级,该模型基于七种语言的2万亿Token进行训练,拥有更多参数和更强性能,据称在某些基准下能超越Llama 2 70B。

来自主题: AI技术研报
7663 点击    2024-04-09 15:44
长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免

长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免

长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免

Anthropic 发现一种新型越狱漏洞并给出了高效的缓解方案,可以将攻击成功率从 61% 降至 2%。

来自主题: AI技术研报
6908 点击    2024-04-03 17:16
全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

全球最强开源模型一夜易主,1320亿参数推理飙升2倍!

【新智元导读】就在刚刚,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!这个过程只用了2个月,1000万美元,和3100块H100。

来自主题: AI技术研报
7613 点击    2024-03-28 16:09